# pip install bert-score
from bert_score import score

# 示例数据（支持多组文本对比）
references = ['我爱自然语言学习','我爱自然语言学习']
candidates = ['我喜欢自然语言','你不爱深度学习']
# 计算 BERTScore
P, R, F1 = score(candidates, references, lang="zh", verbose=True,
                 model_type='bert-base-chinese')
# model_type默认是bert-base-multilingual-cased 也就是多语言bert模型，
# 若想在中文下表现好，可以使用model_type='bert-base-chinese'

# 输出结果
print(f"精确率 (P): {P.tolist()}")
print(f"召回率 (R): {R.tolist()}")
print(f"F1值    : {F1.tolist()}")